U型, 倒U型, 还是线性关系, 你平常的做法不靠谱
可有偿投稿计量经济圈,计量相关则可
邮箱:econometrics666@sina.cn
所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
推荐阅读:
1.实证研究中用到的135篇文章, 社科学者常用toolkit
2.1998-2016年中国地级市年均PM2.5数据release
在实证研究中,我们经常碰到像“库兹涅茨曲线”那样的非线性关系,比如,经济发展阶段与收入不平等之间的关系。我们都知道,在经济发展的初级到中级阶段,随着收入的增长,人们之间的收入不平等现象非常严重;而在经济发展的成熟阶段,随着收入的增长,人们之间的收入不平等现象会减缓。这就是一个收入不平等与经济发展阶段的倒U型关系。
传统的做法,就是把自变量x和x的二次方放进去,然后看他们各自的系数符号和显著性。如果两项系数不显著,那么就证明x与因变量y之间不存在二次型关系。
不过Lind, J. T. and Mehlum, H. (2010)的文章对此进行了质疑。他们认为:"We argue in this paper that this criteria is too weak. The problem arises when the true relationship is convex but monotone. A quadratic approximation will then erroneously yield an extreme point and hence a U shape." 在他们看来,这个标准是相当弱了,尤其是当x与y之间的真实关系是凸且单调的时候。
他们借鉴了Sasabuschi (1980)的工作,做了一个关于两变量间U型或倒U型的检验工作,并且用这个检验公式去探讨AER上用传统方法做的研究。他们的争论点总结是“Most works use the criteria that if both βˆ and ˆγ are significant and if the implied extreme point is within the data range, they have found a U. This is a sensible criteria but it is neither sufficient nor necessary.”
下面,我们将为圈友引荐一下这个程序,并且用相关数据和图表来对结果进行解释。以下三个案例分别是从logit模型,mixed模型和面板数据进行的U型或倒U型的检验。
首先,我们运行一个系统自带的数据,并用它来呈现utest的运行过程。下面是以logit模型做的回归,然后通过这个“utest”程序做的相关检验。数据已经附上,你可以把代码拷贝到Stata上,然后直接运行一下。
sysuse auto,clear
gen mpg2 = mpg^2
logit foreign mpg mpg2
有一些需要注意的地方,因为这里是用的logit模型,因此,需要在utest后面加上prefix(因变量),这里的因变量是foreign。
最后一段文字“Extremum outside interval - trivial failure to reject H0”表明,咱们这个模型在lower bound和upper bound区间并没有U型关系(不管是倒U型还是U型关系)。
这个utest程序没有设置单独的方法去检验是不是有倒U型关系,我们往往是通过slope的正负号进行判断。如果这个模型里存在U型关系,那根据slope在区间里是正号这个特征,我们可以断定这是U型关系。
utest mpg mpg2, prefix(foreign)
下面,我们在做一个多层混合回归模型。从这个模型中,我们能够得出与第一个例子相似的结论,即在自变量week与因变量weight之间没有U型关系出现。
webuse pig, clear
gen week2=week^2
mixed weight week week2 || id:
前面说了,凡是不是regress形式的线性回归,那么我们都需要使用prefix(因变量)来进行utest。
utest week week2, prefix(weight)
下面,我们来看看用面板的固定效应做一个回归,其中的costratiW是因变量——保险公司的成本率,而InassetsW是自变量——保险公司的资产,InassetsWsq是InassetsW的二次项,即InassetsWsq = squared InassetsW。先加上其他的协变量,我们做一个关于保险公司资产是否影响其成本率及怎样影响成本率的回归。#这个没有带上数据#
回归之后,我们再使用utest进行二次项检验——即看看是U型二次项还是倒U型二次项还是单调线性的,注意:utest后面紧跟的是因变量InasstsW和InassetsWsq。
最后一段文字“Extremum outside interval - trivial failure to reject H0”表明,咱们这个模型在lower bound和upper bound区间并没有U型关系(不管是倒U型还是U型关系)。
这个utest程序没有设置单独的方法去检验是不是有倒U型关系,我们往往是通过slope的正负号进行判断。如果这个模型里存在U型关系,那根据slope在区间里是负号这个特征,我们可以断定这是倒U型关系。
参考文献:With or Without U? The Appropriate Test for a U‐Shaped Relationship*作者:Jo Thori Lind和Halvor Mehlum
所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
可以到计量经济圈社群进一步访问交流各种学术问题,这年头,我们不能强调一个人的英雄主义,需要多多汲取他人的经验教训来让自己少走弯路。
计量经济圈当前有几个阵地,他们分别是如下4个matrix:
①小鹅社群:数据软件书籍等所有资料(最多),
②微信群:服务于计量经济圈社群群友(最活跃),
③研究小组:因果推断, 空间计量, 面板数据(最专业),
④QQ群:2000人大群服务于社群群友(最大)。
计量经济圈是中国计量第一大社区,我们致力于推动中国计量理论和实证技能的提升,圈子以海内外高校研究生和教师为主。计量经济圈六多精神:计量资料多,社会科学数据多,科研牛人多,名校人物多,热情互助多,前沿趋势多。如果你热爱计量并希望长见识,那欢迎你加入到咱们这个大家庭(戳这里),要不然你只能去其他那些Open access圈子了。注意:进去之后一定要看小鹅社群“群公告”,不然接收不了群息,也不知道怎么进入咱们独一无二的微信群和QQ群。
只有进去之后才能够看见这个群公告